Der Wettlauf von Big Tech um Trainingsdaten für künstliche Intelligenz von alten Webplattformen

Big Tech's Race to Acquire Training Data for Artificial Intelligence from Old Web Platforms - Business Standard and RAPPLER, Concept art for illustrative purpose, tags: und - Monok
Big Tech's Race to Acquire Training Data for Artificial Intelligence from Old Web Platforms - Business Standard and RAPPLER, Concept art for illustrative purpose, tags: und - Monok
Big Tech’s Race to Acquire Training Data for Artificial Intelligence from Old Web Platforms – Business Standard and RAPPLER, Concept art for illustrative purpose – Monok

Anfang der 2000er Jahre war Photobucket mit 70 Millionen Nutzern und fast der Hälfte des US-amerikanischen Online-Fotomarktanteils eine führende Website für die Bereitstellung von Bildern.

Heute hat sie nur noch 2 Millionen Nutzer, aber die generative KI-Revolution könnte der Plattform neues Leben einhauchen.

CEO Ted Leonard ist in Gesprächen mit mehreren Technologieunternehmen, um die 13 Milliarden Fotos und Videos von Photobucket für das Training generativer KI-Modelle zu lizenzieren. Die laufenden Verhandlungen erwecken den Eindruck, dass das Unternehmen auf Inhalten im Wert von Milliarden von Dollar sitzen könnte.

Die Preise reichen von 5 Cent bis 1 Dollar pro Foto und mehr als 1 Dollar pro Video und können je nach Käufer und gewünschtem Bildmaterial stark variieren.

Unternehmen sind auf der Suche nach riesigen Datenmengen, um ihre grundlegenden KI-Modelle zu entwickeln, die viel Rechenleistung erfordern und oft Monate in Anspruch nehmen.

Der verborgene Markt für Daten zum Trainieren von KI wächst rasant, da die Unternehmen versuchen, sich die Datenlieferketten durch Vereinbarungen mit Inhaltseigentümern oder Datenmaklern zu sichern.

Tech-Giganten wie Google, Microsoft, Meta, Apple und Amazon nutzten zunächst kostenlos gescrapte Webdaten, um ihre Modelle zu trainieren, kaufen aber inzwischen auch Inhalte, die hinter Bezahlschranken verschlossen sind.

Der Markt für KI-Trainingsdaten wird derzeit auf rund 2,5 Milliarden Dollar geschätzt und könnte innerhalb eines Jahrzehnts fast 30 Milliarden Dollar erreichen.

Wir haben mit Unternehmen gesprochen, die gesagt haben: „Wir brauchen viel mehr“.

Ted Leonard

Die Nutzung dieser Daten wirft jedoch Bedenken hinsichtlich des Datenschutzes und ethischer Fragen auf, da KI-Systeme dafür bekannt sind, dass sie ohne Zustimmung exakte Kopien ihrer Trainingsdaten ausspucken.

Im Gegensatz zur Monetarisierung durch Werbung sieht Ted Leonard, Chief Executive Officer von Photobucket, in der Lizenzierung des riesigen Fundus von 13 Milliarden Bildern und Videos der Plattform eine lukrative Alternative.

Gleichzeitig plädiert die Geschäftsführerin von DEFINED.AI, Dr. Daniela Braga, für ethisch einwandfrei beschaffte Daten, die mit Zustimmung erworben und anonymisiert werden, um die Privatsphäre des Einzelnen zu schützen.

Big Tech

Big Tech, also known as the Tech Giants, are the largest information technology companies. The term most often refers to the Big Five tech companies in the United States: Alphabet , Amazon, Apple, (wikipedia)

Amazon (company)

Amazon.com, Inc., doing business as Amazon , is an American multinational technology company, engaged in e-commerce, cloud computing, online advertising, digital streaming, (wikipedia)